智能论文笔记

Solving 3D Radar Imaging Inverse Problems with a Multi-cognition Task-oriented Framework

Xu Zhan , Xiaoling Zhang , Mou Wang , Jun Shi , Shunjun Wei , Tianjiao Zeng

分类：计算机视觉

2022-11-28

This work focuses on 3D Radar imaging inverse problems. Current methods obtain undifferentiated results that suffer task-depended information retrieval loss and thus don't meet the task's specific demands well. For example, biased scattering energy may be acceptable for screen imaging but not for scattering diagnosis. To address this issue, we propose a new task-oriented imaging framework. The imaging principle is task-oriented through an analysis phase to obtain task's demands. The imaging model is multi-cognition regularized to embed and fulfill demands. The imaging method is designed to be general-ized, where couplings between cognitions are decoupled and solved individually with approximation and variable-splitting techniques. Tasks include scattering diagnosis, person screen imaging, and parcel screening imaging are given as examples. Experiments on data from two systems indicate that the pro-posed framework outperforms the current ones in task-depended information retrieval.

translated by 谷歌翻译

BLOOM: A 176B-Parameter Open-Access Multilingual Language Model

Teven Le Scao , Angela Fan , Christopher Akiki , Ellie Pavlick , Suzana Ilić , Daniel Hesslow , Roman Castagné , Alexandra Sasha Luccioni , François Yvon , Matthias Gallé

分类：自然语言处理

2022-11-09

Large language models (LLMs) have been shown to be able to perform new tasks based on a few demonstrations or natural language instructions. While these capabilities have led to widespread adoption, most LLMs are developed by resource-rich organizations and are frequently kept from the public. As a step towards democratizing this powerful technology, we present BLOOM, a 176B-parameter open-access language model designed and built thanks to a collaboration of hundreds of researchers. BLOOM is a decoder-only Transformer language model that was trained on the ROOTS corpus, a dataset comprising hundreds of sources in 46 natural and 13 programming languages (59 in total). We find that BLOOM achieves competitive performance on a wide variety of benchmarks, with stronger results after undergoing multitask prompted finetuning. To facilitate future research and applications using LLMs, we publicly release our models and code under the Responsible AI License.

translated by 谷歌翻译

Distribution Calibration for Out-of-Domain Detection with Bayesian Approximation

Yanan Wu , Zhiyuan Zeng , Keqing He , Yutao Mou , Pei Wang , Weiran Xu

分类：自然语言处理

2022-09-14

室外（OOD）检测是面向任务的对话框系统中的关键组件，旨在确定查询是否不在预定义的支持的意图集之外。事实证明，先前基于软磁性的检测算法对OOD样品被过度自信。在本文中，我们分析了过度自信的OOD来自由于训练和测试分布之间的不匹配而导致的分布不确定性，这使得该模型无法自信地做出预测，因此可能导致异常软磁得分。我们提出了一个贝叶斯OOD检测框架，以使用Monte-Carlo辍学来校准分布不确定性。我们的方法是灵活的，并且可以轻松地插入现有的基于软磁性的基线和增益33.33 \％OOD F1改进，而与MSP相比仅增加了0.41 \％的推理时间。进一步的分析表明，贝叶斯学习对OOD检测的有效性。

translated by 谷歌翻译

Few Clean Instances Help Denoising Distant Supervision

Yufang Liu , Ziyin Huang , Yijun Wang , Changzhi Sun , Man Lan , Yuanbin Wu , Xiaofeng Mou , Ding Wang

分类：自然语言处理

2022-09-14

现有的远处监督的关系提取器通常依靠嘈杂的数据进行模型培训和评估，这可能导致垃圾堆放系统。为了减轻问题，我们研究了小型清洁数据集是否可以帮助提高远距离监督模型的质量。我们表明，除了对模型进行更具说服力的评估外，一个小的清洁数据集还可以帮助我们构建更强大的Denoising模型。具体而言，我们提出了一个基于影响函数的清洁实例选择的新标准。它收集了样本级别的证据，以识别良好实例（这比损失级别的证据更具信息性）。我们还提出了一种教师实习机制，以控制自举套件时中间结果的纯度。整个方法是模型不合时宜的，并且在denoising Real（NYT）和合成噪声数据集上都表现出强烈的性能。

translated by 谷歌翻译

Generalized Intent Discovery: Learning from Open World Dialogue System

Yutao Mou , Keqing He , Yanan Wu , Pei Wang , Jingang Wang , Wei Wu , Yi Huang , Junlan Feng , Weiran Xu

分类：自然语言处理

2022-09-13

传统意图分类模型基于预定义的意图集，仅识别有限的内域（IND）意图类别。但是用户可以在实用的对话系统中输入室外（OOD）查询。这样的OOD查询可以提供未来改进的方向。在本文中，我们定义了一项新任务，广义意图发现（GID），旨在将IND意图分类器扩展到包括IND和OOD意图在内的开放世界意图集。我们希望在发现和识别新的未标记的OOD类型的同时，同时对一组标记的IND意图类进行分类。我们为不同的应用程序方案构建了三个公共数据集，并提出了两种框架，即基于管道的框架和端到端，以实现未来的工作。此外，我们进行详尽的实验和定性分析，以理解关键挑战，并为未来的GID研究提供新的指导。

translated by 谷歌翻译

Deep Contrastive One-Class Time Series Anomaly Detection

Rui Wang , Chongwei Liu , Xudong Mou , Xiaohui Guo , Kai Gao , Pin Liu , Tianyu Wo , Xudong Liu

分类：机器学习 | 人工智能

2022-07-04

时间序列数据的积累和标签的不存在使时间序列异常检测（AD）是自我监督的深度学习任务。基于单拟合的方法只能触及整个正态性的某些方面，不足以检测各种异常。其中，AD采用的对比度学习方法总是选择正常的负面对，这是反对AD任务的目的。现有的基于多促进的方法通常是两阶段的，首先应用了训练过程，其目标可能与AD不同，因此性能受到预训练的表示的限制。本文提出了一种深层对比的单级异常检测方法（COCA），该方法结合了对比度学习和一级分类的正态性假设。关键思想是将表示和重建表示形式视为无阴性对比度学习的积极对，我们将其命名为序列对比。然后，我们应用了由不变性和方差项组成的对比度损失函数，前者同时优化了这两个假设的损失，后者则防止了超晶体崩溃。在四个现实世界中的时间序列数据集上进行的广泛实验表明，所提出的方法的卓越性能达到了最新。该代码可在https://github.com/ruiking04/coca上公开获得。

translated by 谷歌翻译

Self-supervised Learning in Remote Sensing: A Review

Yi Wang , Conrad M Albrecht , Nassim Ait Ali Braham , Lichao Mou , Xiao Xiang Zhu

分类：计算机视觉

2022-06-27

在深度学习研究中，自学学习（SSL）引起了极大的关注，引起了计算机视觉和遥感社区的兴趣。尽管计算机视觉取得了很大的成功，但SSL在地球观测领域的大部分潜力仍然锁定。在本文中，我们对在遥感的背景下为计算机视觉的SSL概念和最新发展提供了介绍，并回顾了SSL中的概念和最新发展。此外，我们在流行的遥感数据集上提供了现代SSL算法的初步基准，从而验证了SSL在遥感中的潜力，并提供了有关数据增强的扩展研究。最后，我们确定了SSL未来研究的有希望的方向的地球观察（SSL4EO），以铺平了两个领域的富有成效的相互作用。

translated by 谷歌翻译

MM-RealSR: Metric Learning based Interactive Modulation for Real-World Super-Resolution

Chong Mou , Yanze Wu , Xintao Wang , Chao Dong , Jian Zhang , Ying Shan

分类：计算机视觉

2022-05-10

交互式图像恢复旨在通过调整几个控制系数来恢复图像，从而确定恢复强度。现有方法在学习已知降解类型和级别的监督下学习可控功能受到限制。当真正的降解与假设不同时，它们通常会遭受严重的性能下降。这样的限制是由于现实世界下降的复杂性，无法在培训期间对交互式调制提供明确的监督。但是，尚未研究如何实现现实世界中超级分辨率中的交互式调制。在这项工作中，我们提出了基于公制的实现现实世界超级分辨率（MM-REALSR）的交互式调制。具体而言，我们提出了一种无监督的退化估计策略，以估计现实情况下的降解水平。我们提出了一种度量学习策略，而不是将已知的降解水平作为对互动机制的明确监督，而是提出了一种度量策略，以将现实世界情景中的不可量化的降解水平映射到公制空间，该度量空间以不受监督的方式进行培训。此外，我们在度量学习过程中引入了锚点策略，以使度量空间的分布正常化。广泛的实验表明，所提出的MM-REALSR在现实世界中的超级分辨率中实现了出色的调制和恢复性能。代码可在https://github.com/tencentarc/mm-realsr上找到。

translated by 谷歌翻译

Large-scale Building Height Retrieval from Single SAR Imagery based on Bounding Box Regression Networks

Yao Sun , Lichao Mou , Yuanyuan Wang , Sina Montazeri , Xiao Xiang Zhu

分类：计算机视觉

2021-11-18

从合成孔径雷达（SAR）图像建立高度检索，对于城市应用来说，对于城市应用来说，对于SAR数据的复杂性来说，这一极为重视。本文从单个Terrasar-X Spotlight或Stribmap图像中解决了大型城市地区建立高度检索问题的问题。基于雷达观看几何形状，我们提出该问题可以作为边界框回归问题制定，因此允许将高度数据集成在更大的规模上生成地面真实。我们从地理信息系统（GIS）数据中的建筑占用脚印作为互补信息，并提出了一种限制框回归网络，该网络利用建筑物占地面积与其边界框之间的位置关系，允许快速计算。这对于大型应用来说很重要。在高分辨率聚光灯和RILTMAP模式下，使用Terrasar-X图像在四个城市数据集上验证该方法。实验结果表明，与基于速度的R-CNN的方法相比，所提出的网络可以显着降低计算成本，同时保持各个建筑物的高度精度。此外，我们调查了GIS数据对我们所提出的网络的影响，并且本研究表明边界框回归网络对GIS数据中的定位误差具有稳健。该方法具有适用于区域甚至全球范围的潜力。

translated by 谷歌翻译

SCIDA: Self-Correction Integrated Domain Adaptation from Single- to Multi-label Aerial Images

Tianze Yu , Jianzhe Lin , Lichao Mou , Yuansheng Hua , Xiaoxiang Zhu , Z. Jane Wang

分类：计算机视觉

2021-08-15

用于图像分类的最可公开的数据集是单个标签，而图像在我们的日常生活中是固有的多标记。这种注释差距使得许多预先接受的单标准分类模型在实际情况下失败。该注释问题更加关注空中图像：从传感器收集的空中数据自然地覆盖具有多个标签的相对大的陆地面积，而被广泛可用的注释空中数据集（例如，UCM，AID）是单标记的。作为手动注释的多标签空中图像将是时间/劳动，我们提出了一种新的自我校正综合域适应（SCIDA）方法，用于自动多标签学习。 SCIDA是弱监督，即，自动学习多标签图像分类模型，从使用大量的公共可用的单一标签图像。为实现这一目标，我们提出了一种新颖的标签 - 明智的自我校正（LWC）模块，以更好地探索潜在的标签相关性。该模块还使无监督的域适配（UDA）从单个到多标签数据中可能。对于模型培训，所提出的型号仅使用单一标签信息，但不需要先验知识的多标记数据;它预测了多标签空中图像的标签。在我们的实验中，用单标签的MAI-AID-S和MAI-UCM-S数据集接受培训，所提出的模型直接在收集的多场景空中图像（MAI）数据集上进行测试。

translated by 谷歌翻译